2006. 6. 『문자코드연구센터 소식지』 17호



문자 코드 진화의 역사


김  현(한국학중앙연구원 교수)


  이메일(e-mail)이 오늘날처럼 일반화되기 이전, 외국의 거래처와 전문을 주고받는 수단으로 텔렉스(TELEX)라는 통신 장비를 사용하였다. 한 쪽에서 키보드로 문자를 입력하면, 상대방의 프린터에 그 글자가 인쇄되도록 하는 장치였다. 1930년대 미국에서 최초의 서비스가 시행된 후부터 거의 반세기 동안 텔렉스는 혁명적인 문명의 이기로 여겨졌지만, 이 기계로 전송할 수 있는 문자는 영문 알파벳, 그것도 대문자뿐이었다. 하나의 문자를 위해 5비트의 신호만 할당했기 때문에 표현할 수 있는 문자의 수가 32개(25=32)로 한정되었던 것이다.

  1960년대 미국에서 처음으로 컴퓨터를 위한 표준 문자 코드를 만들 때 상황이 약간 개선되기는 하였다. 이번에는 7 비트의 신호로 128개의 문자가 표현되도록 한 것이다. 그러나 이것을 가지고 비영어권 국가의 문자까지 담아낼 수는 없었다. 그 후 컴퓨터 문자 코드가 8 비트로 확장됨으로써 256개의 문자를 지원할 수 있게 된 것은 영어권 이외의 유럽 국가들을 고려해서였다. 서양 문자와 전혀 다른 아시아 국가의 문자는 1980년대에 와서야  정보 기술의 국제 무대에서 주목받기 시작하였다.

  1990년대 초 컴퓨터계의 다국적 기업들이 중심이 되어 결성한 유니코드(UniCode) 컨소시엄은 데이터 처리의 장애 요인이 되어 온 문자 코드 문제를 근본적으로 해결하고자 하는 취지에서 문자 코드의 세계적 표준화를 제안하였다. 이로부터 만들어지게 된 유니코드는 16 비트로 65,536개의 문자가 표현되도록 하고, 그 중 2048 문자는 중첩하여 쓸 수 있도록 함으로서 추가로 1,048,576자(1024x1024)의 문자를 쓸 수 있게 하였다.

  정보 통신에 사용할 수 있는 문자의 수가 32개에서 1백만 개로 늘어나기까지는 60년의 세월이 필요했다. 이 기간 동안 이루어진 변화는  전자적인 의사소통의 무대가 ‘영어권’에서 ‘세계’로 확대되었다는 의미를 갖는다.

중요한 사실은 유니코드를 통해 새롭게 열린 국제적 디지털 문자 환경에서는 ‘한국’이라고 하는 나라의 비중이 매우 높다는 점이다. 유니코드의 1백만 자 코드 영역은 이제 겨우 1/10 정도가 채워졌을 뿐인데, 그 중의 상당 부분을 한자와 한글이 차지하고 있다. 세계가 공유하는 디지털 문자 부호계를 더욱 합리적으로 발전시키는 과업의 적지 않은 부분이 우리에게도 주어진 것이다. 문자코드연구센터의 활동이 그 과업을 충실히 이행하는 성과로 이어지기를 기대한다.